LQR和iLQR、DDP
LQR直接通過backward和forward 過程給出最控制率和軌跡,而iLQR初始化一條軌跡,然后用LQR動態優化這條軌跡,直到找到最優解; LQR是在環境線性化模型、cost function ...
LQR直接通過backward和forward 過程給出最控制率和軌跡,而iLQR初始化一條軌跡,然后用LQR動態優化這條軌跡,直到找到最優解; LQR是在環境線性化模型、cost function ...